• 游客发表

    硅谷青睐的中国模型更新了!一觉醒来,直接套壳

    发帖时间:2026-03-19 03:19:58

    新智元报道

    编辑:编辑部

    【新智元导读】智谱作为「大模型第一股」赴港上市前夕,直接掏出了旗舰模型GLM-4.7并开源!

    2025年底智谱压轴了,还是一炮双响!

    一份招股书冲刺「大模型第一股」,紧跟着发布了最新一代开源大模型GLM-4.7!

    经过一年的狂飙突进后,智谱用一场资本和科技完美共振的盛宴收官了。

    GLM-4.7这次以「Coding」能力提升为核心定位,直接对标全球顶尖编程模型Claude Sonnet 4.5,在多个权威榜单上不仅拿下了开源第一,更实现了国产模型对硅谷顶尖闭源模型的贴身肉搏。

    这一战绩在Vals Index上体现得淋漓尽致。

    作为一个不仅考量代码能力,还加权了金融、法律等高价值复杂任务的权威榜单,Vals Index向来被视为大模型「经济价值」的风向标。

    GLM-4.7在这里出道即巅峰,直接空降开源模型第一名!

    这意味着,在一个不论出身、只论实力的竞技场里,它把一众知名的欧美开源模型甩在了身后,证明了开源模型在处理高难度、高价值任务上,已经具备了替代闭源巨头的实力。

    而在更能反映开发者真实体感的Design Arena中,GLM-4.7的表现则更具戏剧性。

    由开发者盲测投票得出的胜率(Win Rate)和Elo评分中,GLM-4.7高居第二,紧紧咬住了谷歌的Gemini 3 Pro Preview,甚至超过了Claude Opus 4.5和GPT-5.2。

    与此同时,在代码竞技场WebDev中,GLM-4.7更是直接斩获开源第一,跻身全球第六。

    高耸的柱状图不只是数字,它是全球开发者用脚投票的结果:在高强度的实战对比中,人们更愿意使用GLM-4.7。

    这标志着国产模型终于跨越了从「能用」到「好用」、从「参数对齐」到「体验对齐」的那道天堑。

    在2025年的大部分时间里,Anthropic的Claude系列,特别是Claude Opus 4.5,一直被全球开发者奉为「编程之神」。

    但是GLM-4.7的发布,选择了正面硬刚Claude,对这波操作最开心的,莫过于大洋彼岸的硅谷程序员们了。

    他们一觉醒来惊喜地发现:中国开源界又「送温暖」了! 这次不仅有现成的新模型可以「套壳」,性能还强得离谱。

    这大概就是2025年AI圈魔幻的乐子:美国的编程工具,都等着中国发模型。

    被老外套壳的中国大模型

    又更新了~

    GLM上次火出圈,还是因为Cursor、Windsurf的「自研模型」被发现其实是套的GLM的壳。

    要知道,Cursor的市值加起来比两个智谱都高,结果基座模型还是用的咱们国产的。

    这一次,GLM-4.7更新,大洋彼岸的美国明星科技企业直接不藏了!

    备受海外用户欢迎的Cline、Kilo、Vercel等一众主流AI平台,纷纷在第一时间官宣接入,并对其取得的巨大进步高度评价。

    估值40亿美元的Fireworks同样发电Day0支持——美国人民有更好的模型可以用了!

    为何老外偏爱「中国开源模型」

    硅谷的精明,在于「不看广告看疗效」。

    他们选择GLM等开源模型,无非是因为它不仅便宜,而且真的好用。

    毕竟,相比于昂贵的GPT和Claude系列,GLM提供了几乎同等的Coding能力,但成本极低。

    对于需要大量消耗Token的Agent工具来说,GLM是极佳的「降本增效」引擎。

    不止于美国,智谱目前已在海外拥有超过15万用户,因而每次发布新模型,都备受海外开发者关注。

    智谱Coding Plan的全球化人群分布

    而且老外对于GLM的热情不仅仅是开源免费,能打才是核心因素。

    「体感」拉满,歪果网友又玩疯了

    AI Coding因为涉及到「抽卡」(通过多次重复来得到满意的输出),所以很多展示出来Demo到底是对话几轮以后的结果,很难说清楚。

    因而,开发者的使用「体感」很能说明问题。

    GLM每次一发布,国外的论坛就集体高潮,有赞扬的,有质疑的,但都表现出极大的热情。

    比如有人认为上一个版本GLM-4.6就已经接近Claude的4.5,而且要比4.0更好。

    甚至还有外国老哥认为GLM-5会直接问鼎SOTA!

    国外的著名KOL们也开始自来水的推荐。

    甚至有老哥看了GLM的价格,直接决定先买1年的服务!

    让我们来看看,一向脑洞大开的国外网友能用GLM-4.7玩出什么花吧。

    做个小游戏,不在话下。

    Agentic能力的核心「工具调用」,完成得非常出色。

    做个看起来酷炫的网页,也是信手拈来。

    「理综」考试(多任务集合),顺利通过!

    官方搓出来的「植物大战僵尸」更是惊艳。

    小测一下

    正如前文所说,目前主流的编程工具,如Claude Code、Cursor、Cline等等,都能完美支持GLM-4.7的部署。

    以最火热的Claude Code为例,智谱在官方文档中给出了特别详细的逐步教程(https://docs.bigmodel.cn/cn/coding-plan/tool/claude)。

    进入命令行界面,执行如下运行Coding Tool Helper:

    npx @z_ai/coding-helper

    一键式配齐API等环境参数后,重启Terminal,输入claude,即可在Claude Code中使用GLM-4.7开启你愉快的vibe coding了!

    直接给出提示词:

    设计一个细节丰富的体素风格(voxel-art)场景,核心要是在一座生机勃勃的花园里放一座华丽的宝塔。植物种类要多——特别是樱花树,一定要多来点——确保整体画面看起来生动活泼、色彩鲜艳,而且视觉冲击力要强。随便你用什么体素或者WebGL库都行,但最后给我的必须是一个独立的HTML文件,让我能直接粘贴代码然后在Chrome浏览器里打开看。

    很快,Gemini 3 Pro就交卷了。

    除了宝塔有点歪之外,效果还不错。

    GLM-4.7给出的效果,有点子惊喜。

    除了宝塔、小溪、草地,以及一大片樱花树之外,还有满天飞舞的花瓣。

    更有意思的是,它还自己设计了一键自动旋转画面的功能,沉浸感直接拉满。

    而且,网页版还能实时渲染代码,非常方便。

    第二段提示词:

    1帮我做一个技能五子棋的游戏网页,要求是在普通的五子棋规则上,玩家可以使用技能,其中包括飞沙走石,静如止水,力拔山兮。「飞沙走石」,是把对手的棋子直接扔进什(石)刹海,2技能点;「静如止水」是凝结时间,把对方「速冻」,4技能点;「力拔山兮」是摔坏棋盘,8技能点,直接获胜。黑棋和白棋的技能点要分开算,并且每走一步都可以累加。直接给我HTML文件,画面要美观。需要设计一个电脑对手,让我可以直接和它对战。

    GLM-4.7设计的这个「AI」简直绝了,主打一个「五五开」。

    首场惨败之后瞬间上头,反手就是三连局,根本停不下来……

    再来一个更厉害的!

    首先,输入如下提示词:

    请用HTML、CSS和JS做一个浏览器操作系统,要求包含下面这些功能:

    - 至少有5个App;

    - 这5个App里,必须有两个是真的能玩的游戏;

    - 支持更换壁纸;

    - 再加一个你自己定的「特殊」功能,你得说明白这个功能是啥,以及它特别在哪里。

    然后,直接看效果:

    想当初,让AI写个能玩的贪吃蛇都费劲。

    现在,只需要一小段Prompt,不仅能一口气生成5个能玩的应用,甚至还能搞出一个「操作系统」。

    归根结底,AGI是一场长跑,跑分只是评估性能的一种方式。

    虽然指标提供了必要的参考,但最重要的始终是「体感」。

    真正的智能,不仅仅在于考试拿满分或数据处理得更快,还在于它能否无缝地融入我们的工作流与生活。

    而这一次,它融入的是「编程」。

    参考资料:

    GLM-4.7上线并开源:更强的编码

    秒追ASI

    ⭐点赞、转发、在看一键三连⭐

    点亮星标,锁定新智元极速推送!

      {loop type="link" row=1 }{$vo.title}